面部3D形态模型是无数应用程序的主要计算机视觉主题,并且在过去二十年中已得到高度优化。深层生成网络的巨大改进创造了改善此类模型的各种可能性,并引起了广泛的兴趣。此外,神经辐射领域的最新进展正在彻底改变已知场景的新颖视图综合。在这项工作中,我们提出了一个面部3D形态模型,该模型利用了上述两者,并且可以准确地对受试者的身份,姿势和表达进行建模,并以任意照明形式呈现。这是通过利用强大的基于风格的发电机来克服神经辐射场的两个主要弱点,即它们的刚度和渲染速度来实现的。我们介绍了一个基于样式的生成网络,该网络在一个通过中综合了全部,并且仅在神经辐射场的所需渲染样品中构成。我们创建了一个庞大的标记为面部渲染的合成数据集,并在这些数据上训练网络,以便它可以准确地建模并推广到面部身份,姿势和外观。最后,我们表明该模型可以准确地适合“野外”的任意姿势和照明的面部图像,提取面部特征,并用于在可控条件下重新呈现面部。
translated by 谷歌翻译
我们介绍了bugs(WOB)的世界,这是一个旨在支持视频游戏中自动化错误检测(ABD)研究的开放平台。我们讨论了ABD中的一些开放问题,以及它们与平台设计的关系,认为如果要进一步进展,则需要基于学习的解决方案。该平台的主要功能是越来越多的常见视频游戏错误集合,可用于培训和评估ABD方法。
translated by 谷歌翻译
深入学习模型的压缩在将这些模型部署到边缘设备方面具有根本重要性。在压缩期间,在压缩期间结合硬件模型和应用限制可以最大限度地提高优势,但使其专为一种情况而设计。因此,压缩需要自动化。搜索最佳压缩方法参数被认为是一个优化问题。本文介绍了一种多目标硬件感知量化(MohaQ)方法,其将硬件效率和推理误差视为混合精度量化的目标。该方法通过依赖于两个步骤,在很大的搜索空间中评估候选解决方案。首先,应用训练后量化以进行快速解决方案评估。其次,我们提出了一个名为“基于信标的搜索”的搜索技术,仅在搜索空间中重新选出所选解决方案,并将其用作信标以了解刷新对其他解决方案的影响。为了评估优化潜力,我们使用Timit DataSet选择语音识别模型。该模型基于简单的复发单元(SRU),由于其相当大的加速在其他复发单元上。我们应用了我们在两个平台上运行的方法:SILAGO和BETFUSION。实验评估表明,SRU通过训练后量化可以压缩高达8倍,而误差的任何显着增加,误差只有1.5个百分点增加。在Silago上,唯一的搜索发现解决方案分别实现了最大可能加速和节能的80 \%和64 \%,错误的误差增加了0.5个百分点。在BETFUSION上,对于小SRAM尺寸的约束,基于信标的搜索将推断搜索的错误增益减少4个百分点,并且与BitFusion基线相比,可能的达到的加速度增加到47倍。
translated by 谷歌翻译
我们提出了一种新的双边谈判模型,允许自私的代理人在存在用户偏好不确定性的情况下学习如何在多个问题上进行谈判。该模型依赖于代表代理在协商期间使用的策略的可解释策略模板,并学习模板参数以最大化在多个协商中收到的平均实用程序,从而导致最佳的出价接受和生成。我们的模型还使用深度加强学习来评估阈值实用程序值,了解需要它们的策略,从而导出每个环境状态的最佳实用程序。为了处理用户偏好不确定性,模型依赖于随机搜索,以查找最佳与给定部分偏好配置文件同意的用户模型。在协商时间内应用多目标优化和多标准决策方法,以产生帕累托 - 最佳结果,从而增加了成功(Win-Win)谈判的数量。严谨的实验评估表明,采用我们的模型的代理商在个人以及社会福利公用事业方面优于第10次自动谈判代理竞赛(ANAC'19)的获胜代理商。
translated by 谷歌翻译